查看原文
其他

10月机器学习开源项目Top10

作者 | Mybridge

译者 | 林春眄

整理 | Jane

出品 | AI科技大本营


过去一个月里,我们对近 250 个机器学习开源项目进行了排名,并挑选出热度前 10 的项目。这份清单的平均 github star 数量高达 1345,涵盖了包括深度学习, Tensorflow, 图像分割, 漫画着色, 强化学习,Unity 等主题,希望你能从中找到一个你所感兴趣的项目深入探究。


Top 1 :fastai


fastai 库由 fast.ai 研究团队贡献,使用当前最佳的实践研究简化了快速准确的神经网络训练。你可以在 fastai 官网找到并使用它。fastai 库是基于 fast.ai 团队进行的深度学习最佳实践研究,包括对视觉,文本,表格和协作(协同过滤)模型的支持,方便研究者直接使用。你可以在示例文件夹中找到有关示例,也可以参阅完整的文档以便了解更详细的使用说明。





Github 地址:

https://github.com/fastai/fastai?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

官网:

https://docs.fast.ai/


Top 2:Deepvariant


Deepvariant 是由 Google 研究团队贡献的开源项目,通过运用深度神经网络来从下一代 DNA 序列数据中预测遗传变异。它是基于 Python/C++ 的程序,尚且只支持 Python 2.7,并能够在任何 unix 操作系统上运行。Deepvariant 具有高精度,强鲁棒性,快速高效,灵活性强,易于使用等优点。





Github 地址:

https://github.com/google/deepvariant?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


Top 3:Albumentations 


Albumentations 是一个快速的图像增强库,它易于使用并封装了其他一些图像处理库的功能。此外,它还具有如下特点:


  • 基于高度优化的 opencv 的快速扩充

  • 具有超级简单但功能强大的使用界面,并广泛适用于不用的任务,如分割,检测等

  • 易于定制

  • 易于添加其他的框架,兼容性好





Github 地址:

https://github.com/albu/albumentations?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


Top 4:MangaCraft


MangaCraft 是当前最佳的半自动化漫画着色项目。





Github 地址:

https://github.com/lllyasviel/MangaCraft?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

参考视频:

https://www.bilibili.com/video/av32698923/


Top 5:Holodeck


Holodeck 是用于强化学习和机器人研究的模拟器,它具有高保真性。你可以访问该项目所提供的用户使用手册,以便更加详细的了解整个过程。





Github 地址:

https://github.com/byu-pccl/holodeck?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

使用手册

https://holodeck.readthedocs.io/en/latest/


Top 6:Petastorm


Petastorm 是 Uber ATG 研发的一个开源数据访问库。它可直接从 Apache Parquet格式的数据集中进行单机或分布式训练,以及深度学习模型的评估。此外,Petastorm 还支持当前流行的基于 Python 的机器学习(ML)框架,如 Tensorflow,PyTorch 和PySpark,也可以通过纯 Python 代码来使用它。





Github 地址:

https://github.com/uber/petastorm?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


Top 7:Ngx


Ngx 是一个基于神经网络的视觉生成器和混合器,能够利用神经网络进行 VJing 过程。它将 pix2pix (使用 cGAN 的图像到图像转换)作为 ad-hoc 的下一帧预测模型,使用从视频剪辑中提取的成对连续帧数据进行反复地训练,以便模型能够生成无限持续时间的图像序列。此外,它还能够混合(交叉淡化) 两个 pix2pix 模型,这些模型会产生变化,并转换为生成的视频。





Gituhub 地址:

https://github.com/keijiro/Ngx?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


Top 8:AlphaAI


AlphaAI 是一个使用无监督和监督学习进行股票预测的开源项目,通过堆叠神经网络的实现来预测股票的盈利值。它包含多个训练组件,使用者可以通过调整替换各种组件组成以便模型获得最佳的预测结果。





Gituhub 地址:

https://github.com/VivekPa/AlphaAI?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


Top 9:Blueoil


Blueoil 是一个将深度学习应用于小型设备的开源项目。它能够训练一个神经网络,并将训练好的模型转化为可执行的二进制库,以便通过 FPGA 进行加速。






Gituhub 地址:

https://github.com/blue-oil/blueoil?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


Top 10:Tencent-ml-images


Tencent-ml-images 是包含当前最大的多标签图像数据库(ml-images) 的开源项目,共由 11166 个图像类别,17609752 张训练图像和 88739  哥验证数据的URL 地址组成。此外,通过迁移学习,将ml-images 上预训练好的ResNet-101 模型迁移到 ImageNet  数据库上,能够实现 80.73% 的 Top1 精度。





Gituhub 地址:

https://github.com/Tencent/tencent-ml-images?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more



推荐阅读

互联网公司时尚穿搭指南

【资源】这本开放书籍帮你扫清通往ML的数学绊脚石

最强NLP预训练模型!谷歌BERT横扫11项NLP任务记录

朴素贝叶斯详解及中文舆情分析(附代码实践)

【代码集合】深度强化学习Pytorch实现集锦

pandas入门教程

【资源】机器学习算法工程师手册(PDF下载)

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存